iT邦幫忙

第 11 屆 iThome 鐵人賽

DAY 14
0
Google Developers Machine Learning

AI可以分析股票嗎?系列 第 14

股票市場及python網路爬蟲

  • 分享至 

  • xImage
  •  

零、引言

之前文章中,我對一個簡單的資料集Google_Stock_Price dataset進行測試,並大致上確認了接下來的方向。 我們必須擁有更多的輸入資料、更大的數據集,以及更複雜的網路模型。 為此,如果我們繼續對國外資料進行測試,實在是浪費了硬體資源,所以今天來淺談台灣股票市場以及運用網路資源蒐集股票資料。

之後主要使用的程式碼皆放在最後的參考

一、了解台灣股票市場

我完全不是念相關領域的,也從未接觸過股票市場,所以如有說錯請用力鞭打

爬完資料,我認為台灣股票市場約有四種股票類型 : 「上市」、「上櫃」、「興櫃/未上市」和「期貨」

類型 漲跌幅限制 交易平台 炒作空間
上市 上市五日後10% TWSE 臺灣證券交易所 高,流量大
上櫃 上市五日後10% TWSE 臺灣證券交易所 偏高
興櫃 沒有 TWSE 臺灣證券交易所
未上市 沒有 私下
期貨 沒有 TWSE 臺灣證券交易所

我原本以為只要沒有漲跌幅限制的都有很高的炒作空間,也以為像上市這種已經趨於穩定的商品應該要有比較低的炒作空間,後來經過自己查詢和詢問後,得到的答案是興櫃/未上市在台灣經濟起飛那段才比較多,當時的有成功存活的公司也都大部分上市上櫃了。上市上櫃公司因為交易量大,所以有可能有更多的炒作空間。

  • 為什麼我希望有炒作空間呢?
    • 因為機器看股,在不引入人為加權的情況下,我們無法取得大環境資訊,對於長趨勢股票來說,我們一定無法預測準確。

那麼我們下一步要預測什麼呢?

根據幾天前的測試結果,我認為可以嘗試短線預測,針對上市公司來執行短線買賣動作,我需要蒐集盤中五秒交易資訊、日K和大盤趨勢,這些都可以從台灣證券交易所 到資料,讓我們試試看吧!

二、股票網路爬蟲

其實我之前有寫過,每日自動蒐集即時股票資料,然後上傳到Google Firebase雲端資料庫。 但之後沒有繼續使用了~ 今天我並不會把它拿出來用,而是用網路上大神已經寫好的套件XD (請看最下面參考) 在這邊不提供教學,可以直接到參考看,都說得非常清楚(發懶),這邊最主要是一個簡單的統整。

為何只能從網路? 因為證券公司的app只能「看」,我們無法取得數據線,如果要用證券公司的API通常都要繳費或是需要繁雜程序,此時如果我們不想這麼麻煩,最快的方式就是透過網路爬蟲把你要的資料爬下來!!

  • 台股資訊網站
    • 公開資訊觀測站
    • 台灣證券交易所

雖然平常就是爬這兩個,但其實管道還有許多,我們的上一屆鐵人大神就有一篇簡短的介紹13.股市資料爬蟲苦主

-> 簡單介紹HTTP METHOD

要使用Python http訪問套件requests,我們就要先知道HTTP有幾種method。

method 用途
get 取得資料
head 取得get的http header
put 新增資料,會overwrite
post 新增資料,不會overwrite
patch 更新擴充資料
delete 刪除資料
  • 台灣證券交易所的API可以透過get方式爬到資料
  • 而交易所的表單需要透過post可以爬到更詳細的資料

接下來大致上會如開頭所說,針對短線投資策略下去預測,今天先休息一下XD

參考

超簡單台股每日爬蟲教學
Python 財報爬蟲
Asoul/tsrtc Taiwan Stock Real Time Crawler
Asoul/tsec Taiwan Stock Exchange Crawler
常見的HTTP METHOD的不同性質分析:GET,POST和其他4種METHOD的差別


上一篇
實戰前的測試路(四) :: 非股價預測測試
下一篇
超級簡略的單股買賣模擬器
系列文
AI可以分析股票嗎?30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言